V2EX  ›  英汉词典

Data Cleaning

定义 Definition

data cleaning:数据清洗;指对原始数据进行纠错、去重、补全缺失、统一格式、处理异常值等操作,以提升数据质量,便于后续分析、建模或可视化。(也常称 data cleansing。)

发音 Pronunciation

/ˈdeɪtə ˈkliːnɪŋ/

例句 Examples

Data cleaning takes time, but it prevents mistakes.
数据清洗很花时间,但它能避免错误。

Before building the model, the team performed data cleaning to remove duplicates, standardize date formats, and handle missing values.
在建立模型之前,团队先进行了数据清洗:删除重复记录、统一日期格式,并处理缺失值。

词源 Etymology

data 源自拉丁语 datum(“给出的东西;事实/资料”的单数),后来 data 作为复数形式在英语中广泛表示“数据”。cleaning 来自 clean(清洁)加上 -ing,表示“清理/清洁的过程”。合在一起,data cleaning 比喻性地把“清理脏污”用在“清理数据中的问题”上,是数据分析与数据库领域常见术语,20世纪后期随着信息系统与统计计算普及而更固定化。

相关词 Related Words

文学与著作中的用例 Literary Works

  • Python for Data Analysis(Wes McKinney)——在数据处理章节中讨论清洗/整理数据(如缺失值、重复、格式统一等),常用到“data cleaning”这一表达。
  • Data Mining: Practical Machine Learning Tools and Techniques(Ian H. Witten, Eibe Frank 等)——在数据挖掘流程里强调前期数据清洗与预处理的重要性。
  • The Elements of Statistical Learning(Hastie, Tibshirani, Friedman)——在建模讨论中提到现实数据常需清洗/预处理,相关表述常与“data cleaning”同域出现。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   720 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 21:27 · PVG 05:27 · LAX 13:27 · JFK 16:27
♥ Do have faith in what you're doing.